跳到主要内容

MySQL 的数据页

转载自 了解MySQL数据页吗?说说什么是页分裂吧!

数据页长啥样?

其实上图中的每一部分都能再细分成多少 byte 是 XXX,多少 byte 是 YYY。但是我感觉没必要再分的那么细了,那么多字段我都整出来想必大家也不会看。看了也容易忘,所以将忘就忘,就简单的罗列几个每部分存储着什么作用的数据给大家看。

在 InnoDB 存储引擎中,数据页是 InnoDB 磁盘管理的最小的数据单位,数据页的默认大小为 16KB。

单个数据页的大小并不是一成不变的。

在 MySQL5.6 中:你可以通过参数 innodb_page_size 设置每个数据页的大小为 4KB、8KB、16KB。一旦设置完成后,所有表中的数据页大小都将是你设置的值且不可变。不论你将 innodb_page_size 设置成多大,一个区(extent)1MB 的事实都不会改变。

在 MySQL5.7.6 中:允许你将 innodb_page_size 设置成 32KB、64KB 大小。对于 32KB 大小的数据页来说区的大小被调整成2MB。对于 64KB 大小的数据页来说,区的大小被调整成 4MB。

什么是数据区?

在 MySQL 的设定中,同一个表空间内的一组连续的数据页为一个 extent(区),默认区的大小为 1MB,页的大小为 16KB。

16 * 64 = 1024

也就是说一个区里面会有 64 个连续的数据页。连续的 256 个数据区为一组数据区。

于是我们可以画出这张图:

直观上看,其实不用纳闷为啥 MySQL 按照这样的方式组织存储在磁盘上的数据。

这就好比你搞了个 Java 的封装类描述一类东西,然后再相应的给它加上一些功能方法,或者用golang封装struct去描述一类对象。最终的目的都是为了方便、管理、控制。

约定好了数据的组织方式,那MySQL的作用不就是:按照约定数据规则将数据文件中的数据加载进内存,然后展示给用户看,以及提供其他能力吗?

数据页分裂问题

说起数据页免不了会牵扯到页分裂到问题,下面一起看一下。

假设你现在已经有两个数据页了。并且你正在往第二个数据页中写数据。

关于 B+Tree,你肯定知道 B+Tree 中的叶子结点之间是通过双向链表关联起来的。

在 InnoDB 索引的设定中,要求主键索引是递增的,这样在构建索引树的时候才更加方便。你可以脑补一下。如果按 1、2、3... 递增的顺序给你这些数。是不是很方便的构建一棵树。然后你可以自由自在的在这棵树上玩二分查找。

那假设你 自定义了主键索引,而且你自定义的这个主键索引并不一定是自增的

那就有可能出现下面这种情况 如下图:

假设上图中的 id 就是你自定义的不会自增的主键,然后随着你将数据写入。就导致后一个数据页中的所有行并不一定比前一个数据页中的行的 id 大。

这时就会触发页分裂的逻辑。

页分裂的目的就是保证:后一个数据页中的所有行主键值比前一个数据页中主键值大。

经过分裂调整,可以得到下面的这张图。